Corpus for Benchmarking Clinical Speech De-identification
本文介绍了 SREDH-AICup 敏感健康信息语音语料库,该语料库包含 20 小时经过时间对齐标注的英汉双语临床语音数据,旨在解决临床语音去标识化任务中公开数据集稀缺的问题,并支持多语言隐私保护系统的研究与开发。
193 篇论文
本文介绍了 SREDH-AICup 敏感健康信息语音语料库,该语料库包含 20 小时经过时间对齐标注的英汉双语临床语音数据,旨在解决临床语音去标识化任务中公开数据集稀缺的问题,并支持多语言隐私保护系统的研究与开发。
该研究开发了一个基于 Python 的可重复健康信息学工作流,通过模拟早期肿瘤临床试验中的临床、生物标志物及药代动力学多源数据,成功整合生成了分析就绪数据集、可视化图表及探索性预测模型,从而为早期肿瘤开发的决策支持分析提供了透明且实用的框架。
该研究利用 MIMIC-IV 数据库开发并评估了一种多模态机器学习模型,通过整合结构化电子病历数据与临床笔记文本特征,实现了对住院患者高阿片类药物暴露风险的高精度预测,从而有助于优化住院期间的阿片类药物管理。
本文提出了时间感知 G-Transformer 模型,通过结合因果 G-计算与时间感知注意力机制,有效解决了电子健康记录中不规则采样数据的反事实治疗效果预测难题,并在合成数据及真实癌症患者轨迹上展现出优于现有方法的长程预测精度与不确定性校准能力。
这项针对西非临床实践的人工智能混合方法研究揭示了医生和技术专家强烈倾向于建立独立监管机制、实时监测系统及清晰的责任框架,以确保人工智能在医疗领域的透明、公平与安全部署。
该研究提出了一种结合梯度提升分类器与隐半马尔可夫模型的混合框架,仅利用自我报告症状数据即可在激素验证下实现月经周期四相分类,证明了低负担、无设备监测方案在资源受限环境中的可行性。
这项前瞻性试点研究表明,葡萄牙多学科临床医生对代理式 AI 临床助手"DR. INFO"在节省时间和辅助决策方面表现出高度满意,其净推荐值高达 81.2 且无负面评价,证实了该工具在临床实践中的潜力。
本文提出了 MedScope,一个针对开源轻量级大语言模型在医疗问答任务中的多维度评估基准,通过系统测试揭示了不同模型在性能、效率及鲁棒性上的显著差异,并指出当前模型尚不足以在无监督条件下直接部署于高风险医疗场景。
该研究通过对欧盟前 20 大公共和私人临床试验赞助方的调查,揭示了双方在数据共享政策透明度与操作性指导上的显著差异,指出私营方通常提供更详尽的公开文件,而公共方则多停留在高层承诺,呼吁加强标准化以提升数据重用效率并符合 GDPR 要求。
该研究开发并评估了一种结合微调 Bio-ClinicalBERT 分类器与大语言模型(LLM)修订的多阶段流程,利用本地部署的开源模型,有效克服了养老院文本消息的碎片化与不规范性挑战,显著提升了 Age-Friendly 4M 实体识别的准确性与可扩展性。
该研究提出并评估了一种基于小语言模型的高效管道,能够成功从罕见肾病患者法文临床笔记中提取血清肌酐等纵向生物标志物信息,为数据稀缺场景下的隐私保护型精准医疗研究提供了资源高效的解决方案。
本文提出了 MedResearchBench,这是首个专为评估 AI 系统在涵盖 7 个临床领域、基于公开数据集及高质量论文构建的 16 项任务上执行符合临床规范的研究能力而设计的多领域基准,旨在填补现有基准在医学临床研究评估方面的空白。
本文提出并验证了首个专门用于阿尔茨海默病及相关痴呆症(ADRD)的行为社会因素本体(BSO-AD),该本体通过整合现有本体与文献挖掘构建了系统化的知识框架,并借助专家审查与大语言模型辅助评估证明了其在语义互操作性和结构完整性方面的有效性。
本文介绍并验证了名为 VaaS 的多层幻觉减少流水线,该流水线通过在罕见病数据库构建中的迭代应用与严格基准测试,将 AI 辅助科学中的引用幻觉率降至近乎零,同时证明了其在生产规模下的高成本效益与可靠性。
本文提出了一种名为 ClinicalTAAT 的时间感知 Transformer 模型,通过整合上下文与时变信息从稀疏、不规则的临床事件序列中学习可解释的患者特定表示,从而在儿科急诊队列中显著提升了病情分级与诊断分类性能,并有效识别了具有不同特征的亚组及异常诊疗轨迹,为临床流程分析提供了可扩展的优化框架。
瑞士儿科生长项目(SwissPedGrowth)证实了从瑞士多家儿童医院异构电子健康记录中提取高质量儿童人体测量数据的可行性,尽管数据完整性和跨机构标准化方面仍面临挑战,但经加权处理后该队列在人口学特征上能代表瑞士一般儿童人群。
该研究提出了一种用于评估大语言模型在顺序临床决策中推理病理的诊断传感器,揭示了模型在分阶段信息输入下存在的“收敛性回归”缺陷及“收敛犹豫悖论”,并验证了结构化支架(SIPS)虽可能降低单次准确率,但能显著提升诊断假设的稳定性与可审计性,从而将 AI 治理要求转化为可量化的推理质量指标。
本文提出了 MOE-ECG 框架,通过多目标粒子群优化算法在异质模型池中选择互补分类器,并利用 Dempster-Shafer 理论进行不确定性感知融合,从而在多个公开数据库上实现了比传统方法更鲁棒、更准确的房颤检测。
该研究展示了一种基于大语言模型(LLM)的人机协同患者预筛选工作流,通过在 26 项临床试验中对 39,182 名患者进行低成本(每位患者 0.12 美元)且高效的筛选,实现了高达 94% 的准确率和 98% 的灵敏度,并证明了结合协调员反馈的自动化学习机制能有效提升筛选效率。
本文提出了 HealthFormer,一种利用双层级时间感知 Transformer 对不规则电子健康记录进行建模的预训练框架,该框架通过结合事件内代码聚合与基于 ALiBI 的连续时间注意力机制,在大规模匈牙利健康数据上实现了有效的自监督预训练,并在癌症预测任务中显著优于传统基线模型。